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Полупроводниковые технологии, посредством которых стабильно развивается со- 
временная компьютерная индустрия, в настоящее время быстро приближаются к своим 
физическим, идеологическим и конструктивным пределам. Развитие компьютеров с 
использованием технологии кремниевых микрочипов может быть ограничено вследствие 
невозможности их бесконечной дальнейшей миниатюризации и ростом объемов обмена 
информацией между центральным процессором и оперативной памятью. Порогом про- 
изводительности кремниевых микрочипов (микросхем) является выполнение 1018 опе- 
раций с плавающей запятой в секунду [1]. По-видимому, невозможно преодолеть этот 
рубеж с помощью традиционных дискретных операций с плавающей запятой. В связи с 
этим возникает необходимость создания компьютеров, функционирование которых 
коренным образом отличается от указанной технологии. 

Альтернативой классических компьютеров могут стать биокомпьютеры. Био- 
компьютер — это компьютер, который функционирует как живой организм либо со- 
держит биологические компоненты. В последнем случае в целях создания биокомпью- 
теров используют такое направление исследований, как молекулярные вычисления. 
В качестве вычислительных элементов используют белки и нуклеиновые кислоты. 
Идея о таких вычислительных элементах находится в стадии развития. Проводятся 
как ш уго, так и ш УУо исследования (например, [8-10]). Многообещающие 
результаты этих исследований позволяют надеяться на большие достижения в этом 
направлении [3]. 

Другой подход к созданию биокомпьютера основан на использовании класси- 
ческой материальной базы (кремниевых микрочипов) и адаптивных алгоритмов, анало- 
гичных тем, которые лежат в основе функционирования живых систем, что позволит 
существенно уменьшить число операций с плавающей запятой. Элементарной живой 
системой, которая может функционировать как самостоятельно, так и в составе много- 
клеточного организма, безусловно, является клетка. Клетка содержит множество низко- 
и высокомолекулярных соединений, находящихся между собой в постоянном взаимо- 
действии, что определяет ее жизнедеятельность. Следовательно, прежде чем перейти 
к разработке соответствующих алгоритмов для создания биокомпьютеров такого рода 
(цитокомпьютера), необходимо рассмотреть во взаимосвязи молекулярный состав, а 
затем и надмолекулярную структуру клетки и моделировать их. Решению первой 
задачи, а именно моделированию молекулярной структуры клетки и посвящена на- 
стоящая работа. 

В клетке вычислительные процессы осуществляются с помощью межклеточ- 
ных сигналов, реакция на которые заложена в программу клеточного функциониро- 
вания. В межклеточном обмене информацией сигналом называется действие, когда 
клетка активирует определенные молекулы. Существует два способа такой активации, 
приводящих в обоих случаях к изменению клеточного микроокружения: 1) молекула 
(точнее, ее часть) оказывается на внешней стороне клеточной мембраны; 2) молекула 
выделяется клеткой во внеклеточную (межклеточную) среду. В зависимости от вида 
полученного сигнала ответной реакцией клетки является продуцирование молекул 
определенного вещества либо изменение состояния, поведения клетки и т.д. На каждый 
тип молекул адекватно откликаются только те клетки, в программу которых заложена 
идентификация данного конкретного сигнала. 

Функционирование и поведение живой клетки, в первую очередь, обусловливает 
множество содержащихся в ней нуклеиновых кислот (дезоксирибонуклеиновой — 
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ДНК и рибонуклеиновой — РНК) и белков, которые находятся в динамическом 
взаимодействии друг с другом, а также множество других молекул. Обратимые белок- 
белковые взаимодействия представляют собой один из видов динамических процес- 
сов. В настоящее время становится признанным, что большинство белков эукариот 
являются мультимодульными и полифункциональными [4]. Каждый из модулей 
может выполнять самостоятельную функцию, в результате чего белок приобретает 
способность выполнять целый комплекс различных функций. 

Благодаря мультимодульности и полифункциональности большинства белков 
эукариот, их сложные белковые сети могут переплетаться друг с другом. Способность 
белков восстанавливать правильную трёхмерную структуру после денатурации по- 
зволила выдвинуть гипотезу о том, что вся информация о конечной структуре белка 
содержится в его аминокислотной последовательности [5]. Аналогичным, а также 
иным образом и другие молекулы, содержащиеся в клетке, участвуют в управлении 
ее функционированием. 

Прежде, чем приступить к созданию системы автоматизированной обработки 
информации, основанной на алгоритмах клеточного функционирования (иначе говоря, 
к созданию биокомпьютера, или цитокомпьютера) или хотя к моделированию подходящих 
систем, необходимо сформировать понятия о предметах, фактах и событиях, кото- 
рыми будет оперировать данная система. Для того чтобы привести эти понятия к той 
или иной модели данных, необходимо заменить их информационными представле- 
ниями. Одним из наиболее удобных инструментов унифицированного представления 
данных, независимо от реализующего его программного обеспечения, является модель 
«сущность-связь» (епйбу-ганоп$ р то4е1, ЕК-тоде]) [6]. 

Модель «сущность-связь» (ЕВ-модель) основана на некой важной семанти- 
ческой информации о реальном мире и предназначена для логического представления 
данных. В ней определены значения данных в контексте их взаимосвязи с другими 
данными. Важным является тот факт, что на основании модели «сущность-связь» 
могут быть порождены все существующие модели данных (иерархическая, сетевая, 
реляционная, объектная), поэтому она является наиболее общей. В рамках такой мо- 
дели любой фрагмент предметной области может быть представлен как множество 
сущностей, между которыми существует некоторое множество связей. 

Для построения ЕК-модели молекулярной структуры клетки может быть ис- 
пользован некий гибрид нотаций Чена (обозначение сущностей, связей и атрибутов) и 
Мартина (обозначение степеней связей) [7]. В таблице приведен список соответст- 
вующих обозначений. 

Процесс построения ЕК-модели состоит из нескольких этапов, среди которых: 

— идентификация представляющих интерес сущностей и связей; 

— идентификация семантической информации в наборах сущностей и связей; 

— определение атрибутов сущностей и наборов их значений; 

— определение степеней связей; 

— организация данных в виде отношений «сущность-связь». 

Для построения ЕВ-модели молекулярного состава клетки выделим интересующие 
сущности и связи. Клетка состоит из множества молекул неорганических (воды, 
минеральных солей, неорганических фосфатов, катионов металлов и пр.) и органи- 
ческих (белков, углеводов, жиров, нуклеиновых кислот, органических фосфатов и 
пр.) соединений, которые в ЕВ-модели представляются ее сущностями. 
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Таблица 1 — Условные обозначения ЕК-модели 


Обозначение Содержание 


Имя сущности Сущность (объект системы) 


Группа сущностей (сущности с одинаковым 
набором атрибутов) 


Имя атрибута Атрибут сущности 


Имя атрибута Ключевой атрибут сущности 


' | Набор атрибутов сущности или группы 
во ‚ | сущностей 
Набор связей между сущностями 


Связь между атрибутом и сущностью 


Связь между сущностями 


М—_—_—_ Степень связи «ОДИН-КО-МНОГИМ» 


Модальность связи «может» 


Модальность связи «должен» 


Если сущности имеют одинаковые атрибуты, то они группируются в набор 
сущностей. 

Далее представлены сущности, наборы сущностей, а также их атрибуты, ис- 
пользованные для моделирования молекулярного состава клетки. 

1. Сущность {«Клетка»} представляет собой наиболее высокий уровень сущности 
в данной модели. Набором ее атрибутов являются «Наименование», «Класс», «Гип», 
«Состояние», «Условие изменения состояния». Обозначим их как набор атрибутов 1 
(рис. 2). 

2. Сущность {«Вода»} характеризуется таким набором атрибутов «Концентрация в 
клетке» и «Компартментализация». Обозначим их как набор атрибутов 2 (рис. 2). 

3. Набор сущностей {«Газ», «Минеральная соль», «Фосфат неорганический», 
«Катион металла»} включает набор атрибутов 2 и атрибуты «Наименование», «Класс», 
«Структура», «Процентное содержание в клетке», «Степень растворимости», «Функции». 
Обозначим его как набор атрибутов 3 (рис. 3). 
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Набор атрибутов 1 


Состояние Условие изменения состояния 


1 
1 
1 
1 
1 
1 
Идентификационный код Наименование (Тин) 
: 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 


Рисунок 1 — Сущность «Клетка» с набором атрибутов 


Набор атрибутов 2 


Концентрация в клетке Компартментализация 


Набор атрибутов 2 


Рисунок 3 — Группа сущностей «Газ», «Минеральная соль», «Фосфат 
неорганический», «Катион металла» с атрибутами 


4. Набор сущностей {«Нуклеиновая кислота», «Белок», «Фосфат органический», 
«Углевод»} включает в себя набор атрибутов 3 и атрибут «Молекулярная масса». 
Обозначим его как набор атрибутов 4 (рис. 4). 

5. Сущность «Жир» имеет набор атрибутов 4. От предыдущей группы сущностей 
его отличает только то, что его наличие в клетке необязательно (рис. 5). 

6. В группу сущностей {Другое} выделено все множество других элементов, 
которое может содержаться в клетке и в данной модели эта сущность не атрибутирована. 
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Каждая связь имеет два конца и одно или два наименования. Наименование обычно 
выражается в неопределенной глагольной форме: «иметь», «принадлежать» и т.п. 
Каждое из наименований относится к своему концу связи. Иногда наименования не 
записываются ввиду их очевидности. 


Рисунок 4 — Группа сущностей «Нуклеиновая кислота», «Белок», 
«Фосфат органический», «Углевод» с атрибутами 


Рисунок 5 — Сущность «Жир» с набором атрибутов 


Каждая связь имеет степень (о чем далее) и быть одной из следующих типов: 
«один-к-одному», «один-ко-многим», «много-ко-многим» (табл. 1). Связь типа «один-к- 
одному» означает, что один экземпляр одной сущности связан с одним экземпляром 
другой сущности и чаще всего свидетельствует о том, что на самом деле есть всего 
одна сущность, неправильно разделенная на две. Связь типа «один-ко-многим» означает, 
что один экземпляр одной сущности связан с несколькими экземплярами другой 
сущности. Это наиболее часто встречающийся тип связи. Сущность со стороны 
«один» называется родительской, а сущность со стороны «много» — дочерней. Связь 
типа «много-ко-многим» означает, что каждый экземпляр одной сущности может 
быть связан с несколькими экземплярами другой сущности, и, наоборот. Такой тип 
связи является временным типом связи, допустимым на ранних этапах разработки 
модели и в дальнейшем должен быть заменен двумя связями типа «один-ко-многим» 
путем создания промежуточной сущности. 

Приведем примеры связей разных типов. Пример связи «один-к-одному»: у одного 
нейрона может быть только один аксон. Пример связи «один-ко-многим»: на одном дере- 
ве может быть много плодов. Пример связи «многие-ко-многим»: одна пчела может 
опылить много разных цветков, но в то же время один и тот же цветок могут опылить 
множество разных пчел. 

Степень связи показывает, какое максимальное количество экземпляров данной 
сущности может участвовать в конкретной связи, точнее, в одном экземпляре связи 
(табл. 1). Поскольку рассматривается бинарная связь, то ее характеризуют две степени 
связи для обеих сущностей, участвующих в ее образовании. Для связи «один-к- 
одному» степени равны 1 и 1, для связей «один-ко-многим» — Ти М; для связи 
«многие-к-одному » — Ми 1 (М - количество экземпляров сущностей одного вида, 
связанных с одним экземпляром сущности другого вида); для связи «многие-ко- 
многим» — М и М (М - количество экземпляров сущности одного вида и М -— 
количество экземпляров сущности другого вида, связанные между собой). 
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Каждая связь может иметь одну из двух модальностей связи (табл. 1). Модальность 
«может» означает, что экземпляр одной сущности может быть связан с одним или не- 
сколькими экземплярами другой сущности, а может быть и не связан ни с одним 
экземпляром. Модальность «должен» означает, что экземпляр одной сущности обязан быть 
связан не менее чем с одним экземпляром другой сущности. Модальности разных концов 
связи могут быть разными. 

Поскольку в одной клетке множество молекул различных веществ тем или 
иным образом взаимодействуют с другими, постольку необходимо определить связи 
вида «один-ко-многим» с наименованием «содержит». 

Описанный графический синтаксис позволяет однозначно читать диаграммы 
ЕК-модели (ЕК-диаграммы), пользуясь следующей схемой построения фраз: <Каждый 
экземпляр СУЩНОСТИ 1> <МОДАЛЬНОСТЬ СВЯЗИ> <НАИМЕНОВАНИЕ СВЯЗИ> 
<ТИП СВЯЗИ> <экземпляр СУЩНОСТИ 2>. Каждая связь может быть прочитана 
как слева направо, так и справа налево [7]. Например, диаграмму, изображенную на 
рис. 6, следует читать следующим образом слева направо <Каждая КЛЕТКА> <ДОЛЖНА> 
<СОДЕРЖАТЬ><один или несколько><экземпляров МОЛЕКУЛЫ ВОДЫ?>, или справа 
налево: <Молекула воды><Может><Содержаться в><Клетке>. 


Содержит 


Рисунок 6 — Пример ЕВ-диаграммы 


На рис. 7 представлена модель «Сущность-связь» молекулярного состава клетки. 
Разработанная ЕК-модель описывает молекулярный состав клетки и формализует 
связи между различными структурными компонентами клетки. На ее основе пред- 
ставляется возможным в дальнейшем моделировать функционирования живой клетки, 
используя соответствующие алгоритмы и наличную материальную базу (микро- 
схемы). 

Развиваемый новый подход в развитии биокомпьютерных технологий, основан- 
ный на принципах функционирования клетки как отдельного электронного устройства, 
является перспективным. Разработана ЕК-модель молекулярного состава клетки, ко- 
торая позволяет в дальнейшем перейти к созданию биокомпьютера (цитокомпьютера). 
Однако данная модель не отображает внутриклеточную структуру на надмолекуляр- 
ном уровне, для чего необходимо выделить новый, более высокий, уровень сущностей. 


Приложение. Краткий словарь терминов 


Атрибут (от лат. айтбино — приписывание, признак) — необходимое, сущест- 
венное, неотъемлемое свойство предмета или явления. 

Ключ сущности (англ. Кеу оЁ еп у — ключевой атрибут) — атрибут, уникально 
определяющий сущность. 

Компартментализация (от англ. сотрагитеп" — отделение, отсек) — структурная 
область локализации того или иного вещества в клетке. 

Модель сущность-связь (ЕВ-модель) (англ. епу-геаноп$Мр то4е1, ЕКВМ) — 
модель данных, позволяющая описывать концептуальные схемы предметной области. 
ЕК-модель используется при высокоуровневом (концептуальном) проектировании 
баз данных. С её помощью можно выделить ключевые сущности и обозначить связи, 
которые могут устанавливаться между этими сущностями. 
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Набор атрибутов 1 


Наименование 


Идентификационный код 


И Е р ИИ 


Набор атрибутов 2 


т 
: 
1 1 
| 1 

1 
Концентрация в клетке 
: 
1 1 
1 1 
1 1 
1 1 
1 1 
1 1 
Я 


ро ие рЕдерЫНЕ 


1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
Наименование Компартментализация 

1 

1 

1 

1 

1 

1 

1 

1 

1 

1 

1 

1 

1 

1 

1 

1 


Степень растворимости 


о ВЕНЫ 


Нуклеиновая кислота 


Фосфат неорганический 


Фосфат органический 


1 
1 
1 
1 
1 
- 
1 
Белок 
1 
1 
1 
1 
Минеральная соль 
1 
И 


Углевод 
Катион металла 


Рисунок 7 — ЕК-модель молекулярного состава клетки 
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Набор сущностей (англ. еп бу зе) — множество сущностей одного типа, мно- 
жество сущностей, обладающих одинаковыми свойствами. 

Связь (англ. геаноп$Шр) — ассоциация, установленная между несколькими су- 
щностями. 

Сущность (англ. еп у) — объект, который может быть идентифицирован неким 
способом, отличающим его от других объектов. Примеры: конкретный человек, 
предприятие, событие и т.д. 

Цитокомпьютер — компьютер, функционирование которого основано на алгоритмах 
клеточной жизнедеятельности. 
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КЕ5ОМЕ 
Ц. Сетгаятот, 5.Г. ТегезйсйепКо 


Сопятгиспоп оГЕт-Моае ор те Моесшаг Сотро5оп 
ог Сей Ау Тре Вая15 Оп Еипспотте ОГВюсотршег 
(Суюсотршег) 


Зептсопдис‘ог {еспо]оз1ез ай ау деуе]ор а то4егп сотршег ш4дизту аге по\ 
[254 арргоаснше №0 Феи рБуз1са| ап сопзгасйуе шпи$. 

Реуеюртепе оЁ сотршег$ УИ Ше и5е оЁ{есбпо|озу оЁ зШе1с писгосЬ1рз сап Бе 
ПпйеЯ ие №ю Феш Раифег шипаанханоп ап ото\ оЁ фе ехсвапое оР шЮгтайоп 
Бебмееп Ше сешга| ргосеззште ипй ап гапдот ассез$ тетогу. ТВегеюге Бесотез 
песеззагу сгеае зисВ сотршег$, исйопше оЁ умей 15 гаФсаПу аегет Вот 115 
{есрпо]оэу. 

Ап айегпайуе 10 с1азз1са] сотриегз Базе оп $1Исоп писгосНр$ сап Бе 
Ыосотрщегз. Влосотршег 15 а сотршег а сошатз 6101021са] сотропеп ог псНоп$ 
а а Пуше оггап15т. ш Фе 1авег сазе, ш огдег 0 сгеме а Мосотпрщегз 15 изе4 засн Ппе 
оЁтезеагсй аз а тоесшаг сотрийпе. Аз фе сотршанопа| е@етеп!$ аге изе4 ргофеш5$ ап4 
пас[е1с ас14$, УЛисьВ геас+ ИВ еасЬ оег. То зиаи]ае Фезе ищегасноп$ сап Бе изе4 ЕВ- 
тоде|. 

ТБе рарег 415си$5ез Ше розз16 Пу Юг деуеорше оРа суюсотрщег. СУюсотрщег 
15 а Мосотршег у№еЬ Базе оп а|еогИбиа$ оЁ сеШаг псйопте ап оп ауаЙае 
таепа1 Базе (стр). Еог 15 ригрозе \аз та4е Фе Игз{ё абетрЕ №0 сопзёгисЕ ап ЕВ- 
то4е] оРВе тоесцаг згасваге ог се ап4 \уеге аейпе4 Ше ге]еуапЕ сопсер5. 

Реуеюореа ЕК-тоде! дезсгез {Ве то]есийаг сотроз оп оф се[5. Оп Ве Ба$15 оЁ 
15 по4е] ап фе зеесе отойр$ оЁ епиНез 1$ розз1Ые 1ю сопзёгасе ог Ше згасеага| 
еетеп$ оЁ сеП5 \/асВ аге песеззагу Юг шодейие Мосотршег Базед оп аеотйт$ 
се!аг псйопе. 


Статья поступила в редакцию 27.12.2013. 


46 «Искусственный интеллект» 2014 №1 


